微软开源VibeVoice,小身材大能量,文字瞬间变身90分钟生动对话
想象一下,你手边有个魔法盒子,只需输入一段文字脚本,它就能瞬间吐出长达90分钟的自然对话音频——不止一个声音,而是最多四个不同说话者,语气生动、转折流畅,仿佛真人聊天!这不是科幻电影,而是微软刚刚开源的VibeVoice TTS模型带来的现实革命。
想象一下,你手边有个魔法盒子,只需输入一段文字脚本,它就能瞬间吐出长达90分钟的自然对话音频——不止一个声音,而是最多四个不同说话者,语气生动、转折流畅,仿佛真人聊天!这不是科幻电影,而是微软刚刚开源的VibeVoice TTS模型带来的现实革命。
说起语音合成技术,大多数人可能还停留在那种机械化、单调乏味的电脑声音印象中。前几天,微软研究院刚刚推出的VIBEVOICE技术,彻底颠覆了我们对AI语音合成的认知。这项技术最令人震撼的地方在于,它能够一口气生成长达90分钟的多人对话音频,听起来就像真人在进行自
微软刚刚发布了 VibeVoice,它看起来像是对 Google NotebookLM 的严重威胁,而 NotebookLM 目前仍是 AI 播客生成领域的霸主。作为开源模型且体积较小,这看起来是对 Notebook LM 的一个开放挑战。
播客 notebooklm 说话人 ll vibevoice 2025-08-28 07:39 3
AI 自动生成播客早已不是新鲜事,但常见的 AI 播客只局限于几分钟的双人对话,这是因为传统语音生成模型大多基于离散化方法,更擅长生成短句、单一音色、结构规整的语音内容。近日,微软亚洲研究院提出了一种全新的语音生成模型 VibeVoice。该模型采用 next